我们介绍了声学场景和事件的检测和分类的任务描述(DCASE)2022挑战任务2:“用于应用域通用技术的机器状况监控的无监督异常的声音检测(ASD)”。域转移是ASD系统应用的关键问题。由于域移位可以改变数据的声学特征,因此在源域中训练的模型对目标域的性能较差。在DCASE 2021挑战任务2中,我们组织了一个ASD任务来处理域移动。在此任务中,假定已知域移位的发生。但是,实际上,可能不会给出每个样本的域,并且域移位可能会隐含。在2022年的任务2中,我们专注于域泛化技术,这些技术检测异常,而不论域移动如何。具体而言,每个样品的域未在测试数据中给出,所有域仅允许一个阈值。我们将添加挑战结果和挑战提交截止日期后提交的分析。
translated by 谷歌翻译
使用Denoisis扩散概率模型(DDPM)的神经声码器已通过适应给定的声学特征的扩散噪声分布来改善。在这项研究中,我们提出了适应扩散噪声的素描,以使其随时间变化的光谱包络变得接近条件对数 - 摩尔光谱图。随着时变的过滤这种适应可改善声音质量,尤其是在高频带中。它是在时频域中处理的,以使计算成本几乎与常规DDPM基于DDPM的神经声码器相同。实验结果表明,在分析合成和语音增强方案中,Specgrad比常规DDPM的神经声码器产生比常规DDPM的更高的语音波形。音频演示可在wavegrad.github.io/specgrad/上获得。
translated by 谷歌翻译
Our team, Hibikino-Musashi@Home (the shortened name is HMA), was founded in 2010. It is based in the Kitakyushu Science and Research Park, Japan. We have participated in the RoboCup@Home Japan open competition open platform league every year since 2010. Moreover, we participated in the RoboCup 2017 Nagoya as open platform league and domestic standard platform league teams. Currently, the Hibikino-Musashi@Home team has 20 members from seven different laboratories based in the Kyushu Institute of Technology. In this paper, we introduce the activities of our team and the technologies.
translated by 谷歌翻译
Mutation-based fuzzing has become one of the most common vulnerability discovery solutions over the last decade. Fuzzing can be optimized when targeting specific programs, and given that, some studies have employed online optimization methods to do it automatically, i.e., tuning fuzzers for any given program in a program-agnostic manner. However, previous studies have neither fully explored mutation schemes suitable for online optimization methods, nor online optimization methods suitable for mutation schemes. In this study, we propose an optimization framework called SLOPT that encompasses both a bandit-friendly mutation scheme and mutation-scheme-friendly bandit algorithms. The advantage of SLOPT is that it can generally be incorporated into existing fuzzers, such as AFL and Honggfuzz. As a proof of concept, we implemented SLOPT-AFL++ by integrating SLOPT into AFL++ and showed that the program-agnostic optimization delivered by SLOPT enabled SLOPT-AFL++ to achieve higher code coverage than AFL++ in all of ten real-world FuzzBench programs. Moreover, we ran SLOPT-AFL++ against several real-world programs from OSS-Fuzz and successfully identified three previously unknown vulnerabilities, even though these programs have been fuzzed by AFL++ for a considerable number of CPU days on OSS-Fuzz.
translated by 谷歌翻译
在本文中,我们提出了一种新型的模板匹配方法,其白色平衡调整称为n-White平衡,该方法是针对多胸罩场景提出的。为了减少照明效应的影响,将n-白平衡应用于多弹性颜色恒定的图像,然后通过使用调整后的图像进行模板匹配方法。在实验中,在各种照明条件下,提出的方法的有效性在对象检测任务中有效。
translated by 谷歌翻译
在本文中,我们提出了转换图像和视觉变压器(VIT)模型的组合使用,该模型用秘密键转换。我们首次展示了经过普通图像训练的模型可以直接转换为根据VIT体系结构训练的模型,并且使用测试图像时,转换模型的性能与经过纯图像训练的模型相同用钥匙加密。此外,提出的方案不需要任何特殊准备的数据进行培训模型或网络修改,因此它还使我们可以轻松更新秘密密钥。在实验中,在CIFAR-10数据集中的图像分类任务中,根据性能降解和模型保护性能评估了提出方案的有效性。
translated by 谷歌翻译
通过语音转换(VC)的数据增强已成功应用于仅可用于目标扬声器的中性数据时,已成功地应用于低资源表达文本到语音(TTS)。尽管VC的质量对于这种方法至关重要,但学习稳定的VC模型是一项挑战,因为在低资源场景中的数据量受到限制,并且高度表达的语音具有很大的声学变化。为了解决这个问题,我们提出了一种新型的数据增强方法,该方法结合了变化和VC技术。由于换挡数据的增强功能可以覆盖各种音高动态,因此即使只有目标扬声器中性数据的1000个话语,它也可以极大地稳定VC和TTS模型的训练。主观测试结果表明,与常规方法相比,具有拟议方法的基于快速2的情绪TTS系统改善了自然性和情绪相似性。
translated by 谷歌翻译
我们提出了一种考虑反射率一致性的新型内在图像分解网络。内在图像分解旨在将图像分解为照明 - 不变和照明变体组分,分别称为“反射率”和“遮荫”。虽然有三种一致性的反射率和阴影应该满足,但由于使用白光分解模型和缺乏捕获相同对象的训练图像,大多数传统工作都没有足够地占对反射率的一致性的一致性。照明 - 亮度和可核心条件。因此,通过使用色光模型在所提出的网络中考虑三个一致性,并利用从各种照明条件下拍摄的图像计算的损耗训练网络。另外,所提出的网络可以以自我监督的方式训练,因为可以容易地模拟各种照明条件。实验结果表明,我们的网络可以将图像分解成反射率和阴影组件。
translated by 谷歌翻译
与其他商品一样,市场可以帮助我们有效地生产机器智能。我们提出了一个在互联网上的其他智能系统的智能所定价的市场。同行通过培训神经网络来互相排列,这是学习邻居价值的神经网络。分数累积在数字分类帐上,在数字分类帐上,在网络中额外的重量被货币奖励。然而,这种形式的同伴排名不抵抗勾结,这可能会破坏机制的准确性。该解决方案是一种基于连接的正则化,其指数奖励可信度的对等体,使系统能够抵抗高达50%的网络重量的串联。结果是一个集体运行智能市场,持续生产新培训的模型,并支付创造信息理论价值的贡献者。
translated by 谷歌翻译